Diariamente, tomamos decisões com relação a eventos incertos:
Devo investir na bolsa?
Vale a pena fazer um plano odontológico?
Devo contratar um seguro para o meu carro?
Devo levar um guarda-chuva?
Devo me matricular numa disciplina eletiva com baixa taxa de aprovação?
Experimentos Aleatórios
Experimento: qualquer processo que produza uma observação ou resultado
Experimento Determinístico: é aquele que, dada uma ação controlada, sabemos exatamente qual será o resultado obtido
Exemplo: lançamento de um dado com todas as faces iguais a 6
Único resultado possível? 6
Experimento Aleatório: é aquele em que não se tem certeza sobre seus resultados, a priori. Mútiplos resultados podem ser obtidos a partir de uma única ação. Cada vez que se repete o experimento, o resultado pode ser diferente.
Exemplo: lançamento de um dado de seis faces
Resultados possíveis: {1, 2, 3, 4, 5, 6}
Probabilidade
Probabilidade: medida de incerteza sobre certos eventos ou características de interesse.
Tais eventos, em geral, estão associados a experimentos aleatórios.
Aleatorização:
Jogar um dado.
Jogar uma moeda.
Girar uma roleta.
Ex: para aleatorizar dois tratamentos entre pacientes, pode-se lançar uma moeda. Se sair "cara" o paciente recebe a droga A, se sair "coroa", recebe a droga B.
Exemplo: Lançamento de dado
Você está jogando Ludo: um dado é usado para movimentar as peças.
Em certo ponto do jogo, durante a sua vez, o 6 sai 3 vezes seguidas e você vence o jogo!
Dentre os de 100 lançamentos do dado durante a sua vez, seu oponente no jogo comenta que o 6 saiu 23 vezes.
Seu oponente então reclama que o dado estava te favorecendo com tantos 6, portanto o dado não era "justo".
Exemplo: Lançamento de dado
Se o dado é "justo", quantos 6 você espera que ocorram em 100 lançamentos?
Se um dado "justo" é lançado diversas vezes, esperamos que o 6 ocorra \(1/6\) das vezes.
100 lançamentos: \(100/6\approx 17\) vezes.
É muito improvável que o 6 saia 23 vezes em 100 lançamentos? Como verificar?
Lance o dado 100 vezes.
Conte o número de 6 que aparecem.
Repita várias vezes esse processo.
Você obtém assim a distribuição de frequências do 6 em 100 lançamentos do dado.
Simulação 1: lançamento de um dado 100 vezes
1
2
3
4
5
6
Freq
12
21
28
6
20
13
Simulação 2: lançamento de um dado 100 vezes
1
2
3
4
5
6
Freq
16
19
13
16
14
22
Simulação 3: lançamento de um dado 100 vezes
1
2
3
4
5
6
Freq
11
21
22
13
19
14
Simulação 3: lançamento de um dado 100 vezes
Simulação 3: lançamento de um dado 100 vezes
## Warning: We recommend that you use the dev version of ggplot2 with `ggplotly()`
## Install it with: `devtools::install_github('hadley/ggplot2')`
Simulação 2: lançamento de um dado 100 vezes
## Warning: We recommend that you use the dev version of ggplot2 with `ggplotly()`
## Install it with: `devtools::install_github('hadley/ggplot2')`
Simulação 1: lançamento de um dado 100 vezes
## Warning: We recommend that you use the dev version of ggplot2 with `ggplotly()`
## Install it with: `devtools::install_github('hadley/ggplot2')`
Simulação: lançamento de um dado 100 vezes
A cada simulação (100 lançamentos e anotando o total de 6) obtivemos um resultado diferente: 13, 22 e 14.
Se repetirmos as simulação 1000 vezes, temos uma idéia da distribuição de frequências da proporção de 6 em 100 lançamentos.
Média: 0.167. Mediana: 0.17.
Simulação 4: lançamento de um dado 5000 vezes
## Warning: We recommend that you use the dev version of ggplot2 with `ggplotly()`
## Install it with: `devtools::install_github('hadley/ggplot2')`
Com poucos lançamentos, a proporção de 6 pode flutuar bastante, mas com o aumento do número de lançamentos, a proporção acumulada de 6 estabiliza em \(1/6\).
Lei dos Grandes Números
O resultado da simulação é um caso particular da Lei dos Grandes Números, resultado provado em 1689 pelo matemático suíço Jacob Bernoulli.
Se um evento de probabilidade p é observado repetidamente em ocasiões independentes, a proporção da frequência observada deste evento em relação ao total número de repetições converge em direção a p à medida que o número de repetições se torna arbitrariamente grande.
Probabilidade
Em um fenômeno aleatório, a probabilidade de um resultado acontecer é a proporção de vezes que o resultado ocorreu quando consideramos muitas observações do fenômeno em questão.
Quando dizemos que a probabilidade do \(6\) sair no dado é \(1/6\), estamos dizendo que a proporção esperada de \(6\) em vários lançamentos (observações) do dado é \(1/6\).
Quando a previsão do tempo diz que a chance de chuva para hoje é 70%, quer dizer que para vários dias observados no passado com condições atmosféricas equivalentes ao dia de hoje a proporção observada de dias de chuva foi \(0.7\).
Como calcular probabilidades?
Em um fenômeno aleatório, a probabilidade de um resultado acontecer é a proporção de vezes que o resultado ocorreu quando consideramos muitas observações do fenômeno em questão.
Esta definição nem sempre é útil.
Quando a NASA lançou o primeiro ônibus espacial, como os cientistas sabiam a probabilidade de sucesso? Não havia nenhum dado sobre lançamentos no passado para que se pudesse calcular a probabilidade de sucesso.
Ônibus espacial Columbia
Probabilidade
Algumas vezes, é possível fazer alguma suposição sobre o fenômeno aleatório considerado.
Ao lançar um dado, podemos assumir que cada valor de \(1\) a \(6\) tenha a mesma chance de ocorrer: \(1/6\).
Ao lançar uma moeda, podemos assumir que ela pode cair de um lado ou de outro com a mesma chance: \(1/2\).
Outras vezes, podemos utilizar a distribuição de frequências observadas como uma estimativa das probabilidades.
Exemplo: dado
Estudar as probabilidades de ocorrência das faces de um dado.
Procedimento Empírico: lançar o dado um certo número \(n\) de vezes e contar o número de vezes, \(n_i\), que a face \(i=1,2,3,4,5,6\) ocorre.
Distribuição empírica das probabilidades:
\[f_{i}=\frac{n_{i}}{n}.\]
Para diferentes vezes que esse experimento for realizado, a distribuição de frequência terá resultados diferentes (exemplo anterior, lançamento de 100 dados, várias vezes).
No entanto, espera-se que esses resultados, apesar de distintos, sejam semelhantes.
Distribuição de Probabilidade
Procedimento Teórico: construir a distribuição de frequências populacionais (probabilidades) através de suposições teóricas.
Suposições:
só podem ocorrer 6 faces: \(\{1,2,3,4,5,6\}\);
o dado é perfeitamente equilibrado;
então, cada face deve ocorrer o mesmo número de vezes, ou seja \(f_{i}=\frac{1}{6}\).
Face
1
2
3
4
5
6
Total
Freq. Teórica
\(\frac{1}{6}\)
\(\frac{1}{6}\)
\(\frac{1}{6}\)
\(\frac{1}{6}\)
\(\frac{1}{6}\)
\(\frac{1}{6}\)
1
Espaço Amostral
Para quantificar incerteza em fenômenos aleatórios usando probabilidades, precisamos primeiro especificar o conjunto de todos os possíveis resultados do fenômeno em questão.
Espaço Amostral: todos os resultados possíveis do experimento (aleatório), denotado por \(\Omega=\{\omega_{1},\omega_{2},... \}\).
Probabilidade: \(P(\omega)\), para cada "ponto amostral" \(\omega\).
Exemplos de Espaço amostral
Se o fenômeno considerado é observar o sexo de uma criança ao nascer:
\(\Omega=\{F, M\}\)
Se o experimento consiste em observar os resultados ao lançar uma moeda duas vezes:
Equiprobabilidade: Todos os elementos do espaço amostral tem a mesma probabilidade de acontecer, ou seja,
\[P(\omega_{i})=\frac{1}{n}, \qquad \forall i=1,2, \ldots, n\] Seja \(A=\{\omega_{A_1},...,\omega_{A_m}\}\) um evento em \(\Omega\) com \(m\leq n\) pontos amostrais, então
\[P(A)=\frac{m}{n}\]
Probabilidade de um evento
A probabilidade de um evento \(A\), denotada por \(P(A)\), é obtida somando as probabilidades de cada elemento do espaço amostral que pertence ao evento \(A\).
Quando cada elemento do espaço amostral tem a mesma probabilidade de ocorrer: \[P(A)=\frac{\mbox{número de elementos no evento $A$}}{\mbox{número de elementos do espaço amostral}}\]
Exemplos
Exemplo 1: moeda honesta é lançada uma vez \(\Omega= \{C, X\}\)
Qual a probabilidade dela ter renda acima de 100.000 (evento \(Y\))?
\[Y=\{\mbox{(A, sim), (A,não)}\}\]
\[P(Y)=\frac{10700}{80200}=0.133\]
Exemplo: Qual a chance de cair na malha fina?
Renda
Caiu na malha fina
Não caiu na malha fina
Total
D - abaixo de 25000
90
14010
14100
C - 25000 a 49999
71
30629
30700
B - 50000 a 99999
69
24631
24700
A - acima de 100000
80
10620
10700
Total
310
79890
80200
Se escolhermos uma declaração de 2002 aleatoriamente, qual a probabilidade dela ter renda acima de 100.000 e ter caído na malha fina (evento \(W\))?
\[W=Z\cap Y=\{\mbox{(A, sim)}\}\]
\[P(W)= P(Z\cap Y)=\frac{80}{80200}=0.001\]
Evento complementar
No caso geral, sejam \(A\) e \(B\) subconjuntos de \(\Omega\):
\(A\cap B=\) evento em que \(A\) e \(B\) ocorrem simultaneamente.
\(A\cup B=\) evento em que \(A\) ou \(B\) ocorrem.
\(P(A\cup B)=P(A) + P(B) - P(A\cap B)\).
se \(\{A\cap B\}=\varnothing\), então \(P(A\cup B)=P(A) + P(B)\).
\(A\) e \(B\) são complementares se \(A\cap B = \varnothing\) e \(A\cup B=\Omega\).
como \(P(A) + P(B)=1\), então \(P(B)=1-P(A)\)
\(B\) é denotado por \(B=A^{C}\) (indicado na cor laranja).
Exemplo: Cartões de Crédito
Um estabelecimento aceita Visa ou Mastercard. Dentre os clientes, 22% possuem Mastercard, 58% possuem Visa e 14% possuem os dois. Qual a probabilidade de que um cliente tenha pelo menos um destes cartões?
Exemplo: Cartões de Crédito
Um estabelecimento aceita Visa ou Mastercard. Dentre os clientes, 22% possuem Mastercard, 58% possuem Visa e 14% possuem os dois. Qual a probabilidade de que um cliente tenha pelo menos um destes cartões?
Espaço amostral: \(\Omega=\{V, M, VM, N\}\), onde V="tem só Visa", M="tem só Matercard", VM="tem Visa e Mastercard", N="não tem Visa nem Mastercard".
Evento A: cliente possui Mastercard. \(A=\{M, VM\}\).
Evento B: cliente possui Visa. \(B=\{V, VM\}\).
\(P(A)=0.22\)
\(P(B)=0.58\)
\(P(A\cap B)=0.14\)
Exemplo: Cartões de Crédito
\(A\cup B\): cliente possui pelo menos um dos cartões. \(A\cup B=\{ V,M,VM\}\).